RLHF与RLVR全都要,陈丹琦团队最新力作将推理能力拓展到通用智能 一个月前,我们曾报道过清华姚班校友、普林斯顿教授陈丹琦似乎加入 Thinking Machines Lab的消息。有些爆料认为她在休假一年后,会离开普林斯顿,全职加入 Thinking Machines Lab。 推理 通用 rlvr 陈丹 rlhf 2025-09-28 12:48 5